Variabilité des performances des outils de TAL et genre textuel

نویسندگان

  • Marie-Paule Jacques
  • Nathalie Aussenac-Gilles
چکیده

RÉSUMÉ. Nous rapportons dans cet article un ensemble de résultats liés à la mise au point d’une base de marqueurs de relations lexicales pour un outil d’aide à la réalisation d’ontologies à partir de textes, CAMÉLÉON. L’évaluation de ces patrons sur huit corpus différents montre une grande variation de leurs performances selon le corpus testé. Cela nous conduit à deux sortes de conclusions : 1. dans le cadre de traitements automatiques, il est nécessaire de fournir à l’utilisateur des informations sur les corpus avec lesquels ces traitements ont été mis au point ; 2. la recherche en matière de TAL doit contribuer à définir une meilleure caractérisation des textes et des genres textuels en relation avec les traitements possibles, au-delà d’une classification unique et rigide des textes.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Using automatic speech processing to study French oral vowels

RÉSUMÉ. Le traitement automatique de la parole peut concrètement contribuer à éclairer de nombreuses questions concernant la variabilité phonémique à l’oral. L’exploitation de grandes masses de données permet ainsi de dégager de grandes tendances, dont une interprétation plus fine repose ensuite à la fois sur un éclairage linguistique et sur un certain nombre de précautions méthodologiques. Nou...

متن کامل

Cocytus: parallel NLP over disparate data

As NLP deals with larger datasets and more computationally expensive algorithms, cutting–edge NLP research is increasingly becoming the province of companies like Google who can use an astronomical amount of resources to do NLP tasks. Smaller institutions are being left behind. In addition to this lack of resources, what resources a typical researcher does have access to are represented in a va...

متن کامل

Bayesian belief networks: applications in ecology and natural resource management1

In this introduction to the following series of papers on Bayesian belief networks (BBNs) we briefly summarize BBNs, review their application in ecology and natural resource management, and provide an overview of the papers in this section. We suggest that BBNs are useful tools for representing expert knowledge of an ecosystem, evaluating potential effects of alternative management decisions, a...

متن کامل

Conception et usage des composants métier processus pour les systèmes d'information. (Design and usage of process business components for information systems)

ion : Réutilisation : Légende : SI1 SI2 SIn te l-0 04 30 49 7, v er si on 2 4 Ja n 20 10 Chapitre 3 : Concepts de base et vue métier d’un composant métier processus 82 c) Origines de la variabilité Nous distinguons deux aspects qui peuvent être à l’origine de la variabilité représentée dans des CMP. 1. Variabilité des PM : un CMP modélise des PM similaires qui peuvent être déclinés de plusieurs...

متن کامل

Stratégies pour l'étiquetage et l'analyse syntaxique statistique de phénomènes difficiles en français : études de cas avec Talismane

RÉSUMÉ. Les outils statistiques robustes en TAL, tels que les étiqueteurs morphosyntaxiques et les analyseurs syntaxiques, utilisent souvent des descripteurs « pauvres », qui peuvent être appliqués facilement à n’importe quelle langue, mais ne prennent pas en compte les particularités de la langue. Dans cette étude, nous cherchons à améliorer l’analyse de deux phénomènes en français en injectan...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • TAL

دوره 47  شماره 

صفحات  -

تاریخ انتشار 2006